hadoop mapreduce 如何處理跨行的文本數據
首先我們需要明確一個問題就是,hdfs中blocksize是物理概念是真的把數據進行了按塊切分,而mapreduce 中的切片概念是邏輯層面的並沒有真正按照切片大小對數據進行切分,只是按照預先規划好的 ...
首先我們需要明確一個問題就是,hdfs中blocksize是物理概念是真的把數據進行了按塊切分,而mapreduce 中的切片概念是邏輯層面的並沒有真正按照切片大小對數據進行切分,只是按照預先規划好的 ...